更新时间:2024-06-17 18:09
在分子生物学和遗传学领域,基因组指生物体所有遗传物质的总和。这些遗传物质包括DNA或RNA(病毒RNA)。
基因组DNA包括编码DNA和非编码DNA、线粒体DNA和叶绿体DNA。
基因组这个术语由德国汉堡大学植物学教授Hans Winkler于1920年创建。
研究基因组的科学称为基因组学。
病毒基因组可以由RNA或DNA组成。 RNA病毒的基因组包含单链或双链RNA,也包含一种或多种单独的RNA分子。 DNA病毒基因组可以是单链或双链DNA。大多数DNA病毒基因组由单个线性DNA分子组成,但有些由DNA病毒基因组由环状DNA分子组成。
原核生物和真核生物基因组由DNA组成。古细菌有一个环状染色体组成的DNA基因组。大多数细菌也有一个环状染色体,然而,一些细菌物种含有线性染色体或多个染色体。大多数原核生物基因组中不含有重复DNA。一些共生细菌基因组种含有高比例的假基因,例如Serratia symbiotica基因组种只有约40%的DNA编码蛋白质。 一些细菌基因组还含有辅助遗传物质,它们在质粒中存在。为此,基因组这个词不应该用作染色体的同义词。
真核基因组由一条或多条线性DNA染色体组成。组成真核生物基因组的染色体的数量差异很大,杰克跳线蚂蚁和无性线虫的基因组每个只有一对染色体,而蕨类物种有720对染色体。人类细胞具有22对常染色体和1对性染色体。
除了细胞核中的染色体外,真核生物的细胞器如叶绿体和线粒体都有自己的DNA和染色体,因此,也有“线粒体基因组”和“质体基因组”的说法。与它们来源的细菌一样,线粒体和叶绿体都含有环状染色体。
与原核生物不同,真核生物具有蛋白质编码基因的外显子 -内含子组织和一定数量的重复DNA。哺乳动物和植物基因组的大多数由重复DNA组成。
携带合成蛋白质遗传信息的DNA序列是编码序列。不同物种中编码序列占基因组的比例差异很大。较大的基因组不一定含有更多的基因,并且复杂真核生物中非重复DNA的比例随着基因组大小的增加而减少。简单的真核生物如秀丽隐杆线虫和果蝇中,编码DNA比例高于重复DNA,而更复杂真核生物基因组则往往主要由重复DNA组成。一些植物和两栖动物基因组中重复DNA的比例超过80%。同样,人类基因组中只有2%编码DNA。
非编码序列包括内含子,非编码RNA的序列,调控DNA和重复DNA。人类基因组的98%属于非编码序列。基因组的重复DNA有串联重复序列和分散重复序列。
转座子
转座子(TEs)是具有特定结构的DNA序列,它们可以在基因组中跳动,位置不固定。I类TE通过复制和粘贴机制跳动位置,II类TE从基因组中切除并插入新位置。
TE的运动是真核生物基因组进化的驱动力,因为它们的插入可以破坏基因功能,TE之间的同源重组可以导致基因的复制,TE还可以将外显子和调节序列改组到新的位置。
反转录转座子可以转录成RNA,然后在另一个位点被复制到基因组中。反转录转座子可分为长末端重复序列(LTR)和非长终端重复序列(非LTR)两大类反转录转座子。
基因组大小是一个拷贝的单倍体基因组中DNA碱基对的总数。
基因组大小与原核生物和低等真核生物的形态复杂性呈正相关。然而,在软体动物和上述所有其它高等真核生物之后,这种相关性已不再存在,主要是因为重复DNA的缘故。
生物体所有细胞都源自同一个单细胞,因此它们应该具有相同的基因组。但是,在某些情况下,细胞间会出现差异。细胞分裂期间的DNA复制和环境诱变剂的作用都可导致体细胞发生突变。在某些情况下,这种突变会导致癌症,因为它们会导致细胞更快地分裂并侵入周围组织。 在减数分裂期间,二倍体细胞分裂两次以产生单倍体生殖细胞。在此过程中,重组导致遗传物质从同源染色体重新洗牌,因此每个配子具有独特的基因组。
基因组不仅仅是生物体基因的总和,基因组还含有其它可以考虑特定基因及其产物的特征。
复制在基因组的塑造过程中起了重要作用。复制的范围包括短串联重复序列的延伸、基因簇的复制、整个染色体甚至整个基因组的复制。这种复制可能是创造遗传新性状的基础。
2023年,在绘制基因和细胞图谱方面,美国科学家发布人类泛基因组首个草图,为人类基因组提供了更为完整的图像。俄勒冈健康与科学大学研究人员创建了有史以来最大的健康人体组织合子(两个配子遗传物质融合在一起)后基因组突变图谱,此项进展可为诊断和治疗遗传病开辟新途径。在基因测序方面,英国宣布将对10万名新生儿的基因组进行测序,这将成为同类研究中规模最大的研究,对儿童医学产生深远影响;英国生物银行发布了迄今世界上最大的全基因组测序数据库,有望为全球的诊断、治疗和治愈带来变革;剑桥大学科学家则提出新的DNA测序法,可检测小分子药物与基因组特定位置之间的相互作用,有望为一些药物疗法如何与人类基因组相互作用提供大量新见解。